我们描述了我们的两阶段系统用于多语言信息访问(MIA)2022关于跨语义开放回程问题的共享任务。第一阶段包括多种语通过的检索,并具有混合密集且稀疏的检索策略。第二阶段由读者组成,该读者从第一阶段返回的顶级段落中输出答案。我们展示了使用实体表示,稀疏检索信号来帮助稠密检索的功效以及fusion-In-indecoder。在开发集中,我们在XOR-TYDI QA上获得43.46 F1和MKQA的21.99 F1,平均F1分数为32.73。在测试集中,我们在XOR-TYDI QA上获得40.93 F1和MKQA上的22.29 F1,平均F1分数为31.61。在开发和测试集上,我们在官方基线上提高了4个F1点。
translated by 谷歌翻译
State-of-the-art object detectors are treated as black boxes due to their highly non-linear internal computations. Even with unprecedented advancements in detector performance, the inability to explain how their outputs are generated limits their use in safety-critical applications. Previous work fails to produce explanations for both bounding box and classification decisions, and generally make individual explanations for various detectors. In this paper, we propose an open-source Detector Explanation Toolkit (DExT) which implements the proposed approach to generate a holistic explanation for all detector decisions using certain gradient-based explanation methods. We suggests various multi-object visualization methods to merge the explanations of multiple objects detected in an image as well as the corresponding detections in a single image. The quantitative evaluation show that the Single Shot MultiBox Detector (SSD) is more faithfully explained compared to other detectors regardless of the explanation methods. Both quantitative and human-centric evaluations identify that SmoothGrad with Guided Backpropagation (GBP) provides more trustworthy explanations among selected methods across all detectors. We expect that DExT will motivate practitioners to evaluate object detectors from the interpretability perspective by explaining both bounding box and classification decisions.
translated by 谷歌翻译
近年来,《虚假新闻》的数据科学研究已经筹集了很大的势头,可以说是大型公共基准数据集的出现。尽管在媒体研究中,性别偏见是一个遍布新闻媒体的问题,但对性别偏见与虚假新闻之间的关系几乎没有探索。在这项工作中,我们提供了对假新闻的性别偏见的首次实证分析,利用公共基准数据集利用简单且基于透明的词典的方法。我们的分析确定了在三个方面的假新闻中,性别偏见的普遍性增加,即丰富,情感和近端单词。我们分析中的见解提供了一个强有力的论点,即性别偏见需要成为对假新闻研究的重要考虑因素。
translated by 谷歌翻译
在线广告最近已发展成为一个竞争激烈且复杂的数十亿美元行业,广告商在大型和高频上竞标广告插槽。这导致对有效的“自动招标”算法的需求日益增长,这些算法确定了传入查询的投标,以最大程度地提高广告商的目标,但受其指定的约束。这项工作探讨了在日益流行的约束下,为单个价值最大化广告商提供有效的在线算法:返回式增长(ROS)。相对于最佳算法,我们对遗憾进行了量化效率,该算法知道所有查询所有查询都是先验的。我们贡献了一种简单的在线算法,该算法在期望中实现了近乎最佳的遗憾,同时始终尊重指定的ROS约束,当查询的输入顺序为i.i.d.来自某些分布的样本。我们还将结果与Balseiro,Lu和Mirrokni [BLM20]的先前工作相结合,以实现近乎最佳的遗憾,同时尊重ROS和固定的预算限制。我们的算法遵循原始的二重式框架,并使用在线镜像下降(OMD)进行双重更新。但是,我们需要使用非典型的OMD设置,因此需要使用OMD的经典低rebret保证,该保证是用于在线学习中的对抗性环境的,不再存在。尽管如此,在我们的情况下,在更普遍的情况下,在算法设计中应用低纤维动力学的情况下,OMD遇到的梯度可能远非对抗性,但受我们的算法选择的影响。我们利用这一关键见解来显示我们的OMD设置在我们的算法领域中造成了低落的遗憾。
translated by 谷歌翻译
机器学习中的许多基本问题可以通过convex程序\ [\ min _ {\ theta \ in r^d} \ sum_ {i = 1}^{n} f_ {i}(\ theta),\]每个$ f_i $都是一个凸,Lipschitz函数在$ \ theta $的$ d_i $坐标的子集中支持。以随机梯度下降为例,解决此问题的一种常见方法涉及在每次迭代时对一个$ f_i $术语进行采样以取得进展。这种方法至关重要地依赖于$ f_i $的均匀性概念,该概念正式通过其状况编号捕获。在这项工作中,我们给出了一种将上述凸公式最小化为$ \ epsilon $ -Accuracy in $ \ widetilde {o}(\ sum_ {i = 1}^n d_i \ log(1 /\ epsilon)$计算,没有关于条件号的假设。以前的最佳算法独立于条件编号是标准切割平面方法,它需要$ o(nd \ log(1/\ epsilon))$渐变计算。作为推论,我们改善了Axiotis等人的评估甲骨文的复杂性,可分解性下的最小化。 (ICML 2021)。我们的主要技术贡献是一种自适应程序,可以通过切割平面和内点方法的新型组合在每次迭代中选择$ f_i $项。
translated by 谷歌翻译
Simulating physical network paths (e.g., Internet) is a cornerstone research problem in the emerging sub-field of AI-for-networking. We seek a model that generates end-to-end packet delay values in response to the time-varying load offered by a sender, which is typically a function of the previously output delays. The problem setting is unique, and renders the state-of-the-art text and time-series generative models inapplicable or ineffective. We formulate an ML problem at the intersection of dynamical systems, sequential decision making, and time-series modeling. We propose a novel grey-box approach to network simulation that embeds the semantics of physical network path in a new RNN-style model called RBU, providing the interpretability of standard network simulator tools, the power of neural models, the efficiency of SGD-based techniques for learning, and yielding promising results on synthetic and real-world network traces.
translated by 谷歌翻译
深度神经网络的可解释性已成为勘探的主要领域。虽然这些网络在许多任务中实现了最先进的准确性,但极难解释和解释他们的决定。在这项工作中,我们分析了深度卷积网络的最终和倒数第二层,并提供了一种有效的方法,用于识别贡献对网络决定的最大贡献的特征子集。我们证明,与最终层的尺寸相比,每个类的这种特征的数量远低得多,因此深CNN的决定表面位于低维歧管上,并且与网络深度成比例。我们的方法允许将最终层分解为单独的子空间,该子空间远远不可解释,并且与完整网络的最终层相比具有较低的计算成本。
translated by 谷歌翻译
本文介绍了一种基于AutoEncoder的无监督方法,用于使用机器产生的声音在工业机器中识别异常。使用声音信号的Log-MelspectRoge表示训练所提出的框架。在分类中,我们的假设是,为异常机器计算的重建误差大于正常机器的重建误差,因为只用于训练AutoEncoder的普通机器声音。选择阈值以区分正常和异常的机器。然而,阈值变化为周围条件不同。为了选择适当的阈值,无论周围如何,我们都会提出一个场景分类框架,可以对底层周围分类。因此,无论周围如何,都可以自适应地选择阈值。实验评估是在工业机器的MIMII数据集上进行,即风扇,泵,阀门和滑轨。我们的实验分析表明,利用自适应阈值,性能显着改善,因为仅使用针对给定周围的固定阈值获得的。
translated by 谷歌翻译
在这项工作中,我们提出了一种称为疾病知识神经网络(Dinns)的方法,可以使用能够有效地预测传染病的传播。这种方法在成功的物理学上建立了已经应用于可以通过线性和非线性普通和部分微分方程建模的各种应用的知识神经网络方法。具体而言,我们建立了Pinns向SIR隔间模型的应用,并扩展了描述各种传染病的脚手架数学模型。我们展示神经网络如何能够学习疾病如何传播,预测其进展,并找到其独特参数(例如死亡率)。为了证明Dinns的稳健性和疗效,我们将这种方法应用于11种高度传染病,这些疾病在增加的复杂程度上进行了建模。我们的计算实验表明,Dinns是有效了解传播动态的可靠候选者,并预测其在可用现实世界数据中的进展中的进展。
translated by 谷歌翻译
充电站在开发充电基础设施的区域中的放置是电动汽车未来成功(EV)的关键组成部分。在纽约的奥尔巴尼县,EV人口的预期增加需要额外的充电站,以在整个充电基础设施中保持足够的效率。鉴于预测的充电需求和当前的充电位置,增强学习(RL)的新型应用程序(RL)能够找到新的充电站的最佳位置。影响收费需求预测的最重要因素包括交通密度,EV登记和靠近某些类型的公共建筑。建议的RL框架可以完善并应用于世界各地的城市,以优化充电站的放置。
translated by 谷歌翻译